메뉴

#실시간 처리

HN
Hacker News 26일 전
IMP 8

OpenAI의 대규모 초저지연 음성 AI 구현법

OpenAI가 9억 명 이상의 주간 활성 사용자를 위해 대규모 실시간 음성 AI 서비스를 제공하는 방법을 설명하는 기술 블로그 글입니다. 자연스러운 대화를 방해하는 네트워크 지연을 해결하기 위해 기존 WebRTC 스택을 전면 재설계한 배경과 과정을 다룹니다. 표준 WebRTC의 장점을 살리면서도 OpenAI 인프라에 맞춘 새로운 '분할 릴레이 및 트랜시버(Split relay plus transceiver) 아키텍처'를 도입한 기술적 핵심을 공유합니다.

OpenAI 음성 AI WebRTC
MP
MarkTechPost 28일 전
IMP 8

사카나 AI, 지연 없는 실시간 음성 AI 'KAME' 공개

사카나 AI가 대규모 언어 모델(LLM)의 지식을 실시간으로 주입할 수 있는 새로운 음성 대 음성(Speech-to-Speech) 아키텍처 'KAME'를 소개했습니다. 이 기술은 기존 시스템의 한계를 넘어 응답 지연 시간(Latency)을 전혀 추가하지 않으면서도 고도화된 지식 기반 대화를 가능하게 합니다. 실무자 관점에서 실시간성과 정확성이 필수적인 차세대 AI 음성 비서 개발에 매우 중요한 돌파구로 평가됩니다.

음성 인식 대화형 AI LLM